1
线性的普适性
MATH005Lesson 7
00:00

线性的普适性 可能是概率论中最强大的捷径。它使我们能够通过简单地求和各个随机变量的期望值,来计算它们之和的期望——无论这些变量是否独立、相关或互斥。

1. 基础与命题 2.1

为了理解为什么期望具有如此强的线性特征,我们考察 无意识统计学家法则(LOTUS) 多变量系统中的情况。 命题 2.1 指出:如果 $X$ 和 $Y$ 具有联合概率质量函数 $p(x, y)$,那么任意函数 $g(X, Y)$ 的期望为:

$$E[g(X, Y)] = \sum_{y} \sum_{x} g(x, y) p(x, y)$$

对于具有联合概率密度函数 $f(x, y)$ 的连续变量,其等价的积分形式为:

$$E[g(X, Y)] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(x, y) f(x, y) dx dy$$

2. 线性原理

通过对函数 $g(X, Y) = X + Y$ 应用 LOTUS,我们推导出本课的核心定理: $E[X + Y] = E[X] + E[Y]$。该结论可自然推广到任意有限个随机变量的和:

$E\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n E[X_i]$

这一性质之所以‘普适’,是因为它不需要对联合分布做任何假设。无论变量是独立还是高度相关,总和的平均值始终等于各平均值之和。

例 2a:救护车问题

考虑一条长度为 $L$ 的道路上发生事故的位置 $X$,以及一辆位于 $Y$ 的救护车,其中 $X, Y \sim U(0, L)$ 且相互独立。使用多变量的 LOTUS 计算 $E[|X-Y|]$:

联合概率密度函数为 $f(x, y) = 1/L^2$,其中 $0 \le x, y \le L$。

$$E[|X-Y|] = \int_0^L \int_0^L |x-y| \frac{1}{L^2} dx dy = \frac{L}{3}$$

3. 单调性与界限

期望保持随机变量之间的大小顺序。如果 $X \ge Y$ 对所有结果成立,则 $E[X] \ge E[Y]$。这源于 例 2b:若 $X - Y \ge 0$,则 $E[X - Y] \ge 0$。此外,若一个变量满足 $P\{a \le X \le b\} = 1$,则必有 $a \le E[X] \le b$

4. 样本均值(例 2c)

设 $X_1, \dots, X_n$ 是来自均值为 $\mu$ 的分布的一个样本。 样本均值 定义为:

$$\bar{X} = \sum_{i=1}^{n} \frac{X_i}{n}$$

由于线性性质,$E[\bar{X}] = \frac{1}{n} \sum E[X_i] = \frac{n\mu}{n} = \mu$。 样本均值的期望值为 $\mu$,证明了它是无偏估计量。

⚠️ 无穷级数的注意事项
当处理无穷多个随机变量 $X_i, i \ge 1$ 时,$E[\sum_{i=1}^\infty X_i] = \sum_{i=1}^\infty E[X_i]$ 并不总是成立。只有在以下条件满足时,交换才有效:
  1. 所有 $X_i$ 都是非负随机变量。
  2. 该级数绝对收敛:$\sum_{i=1}^\infty E[|X_i|] < \infty$。